Données semi-structurées. Découverte, maintenance et analyse de tendances
نویسندگان
چکیده
Mining knowledge from structured data has been extensively addressed in the few past years. However, with the growing popularity of the Web, the number of semi structured documents available is rapidly increasing and it is judicious to assume that a query on document structure is almost as important as a query on data. In this paper, we propose an approach to extract such structures. Moreover, manipulated data is constantly being updated; we extend our approach to take into account source evolutions in a knowledge extraction process. Finally, we show that it is possible to analyze trends during the different data sources evolutions. MOTS-CLÉS : données semi structurées, extraction de connaissances, évolutions des sources de données, tendances.
منابع مشابه
Un premier pas vers la modelisation des donnees semi-structurees par la logique multi-modale hybride
RÉSUMÉ. Les documents XML et les données semi-structurées peuvent être représentées par des graphes étiquetés. Dans cet article, nous établissons un lien direct entre ces graphes de données et les modèles d’un langage de la logique multi-modale hybride. Ce lien est ensuite exploré dans deux directions. Tout d’abord, nous nous intéressons à l’expression de contraintes d’intégrité sur des données...
متن کاملApproche Fouille de Texte pour la détection précoce de tendances économiques
Résumé. Cet article présente un retour d’expérience sur de la fouille de données complexes dans un processus d’extraction des connaissances dans un contexte industriel. Á partir de données volumineuses non structurées issues de dépêches d’actualités économiques et selon certains traitements linguistiques et économétriques, notre objectif est de prédire des tendances économiques dans des séquenc...
متن کاملDes séquences aux tendances
RÉSUMÉ. Les données temporelles peuvent être traitées de nombreuses façons afin d’en extraire des connaissances. La découverte de motifs séquentiels met en évidence des sous-séquences fréquentes contenues dans des séquences d’enregistrements annotés temporellement. L’analyse des accès à un site web permet par exemple de découvrir que “5% des utilisateurs accèdent à la page register.php puis à l...
متن کاملMéthodes à noyaux appliquées aux textes structurés
Résumé. Cet article ébauche un état de l’art sur l’utilisation des noyaux pour le traitement des données structurées. Les applications modernes de la fouille de données sont de plus en plus confrontés à des données structurées, notamment textuelles. Les algorithmes d’apprentissage doivent donc être capables de tirer parti des informations apportées par la structure, ce qui pose d’intéressants p...
متن کاملRègles graduelles et cubes de données : quand les blocs s'empilent !
Résumé. Le couplage des méthodes de fouille de données et d’entrepôts de données permet d’extraire des informations pertinentes à partir de cubes de données. Dans ce contexte, de nombreuses approches ont été proposées, permettant par exemple d’extraire des règles d’association ou des motifs séquentiels. Cependant, il n’existe pas de méthodes permettant d’extraire des règles graduelles. Dans cet...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- Ingénierie des Systèmes d'Information
دوره 8 شماره
صفحات -
تاریخ انتشار 2003